Domain Generalization - Part1
date
Oct 15, 2024
Last edited time
Oct 15, 2024 05:44 AM
status
Published
slug
Domain Generalization - Part1
tags
DL
summary
type
Post
origin
Field
Plat
(ACM2022) Domain Generalization via Frequency-domain-based Feature Disentanglement and Interaction
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2Fa5a6860e-d97d-42cd-bbbd-201068a1a71d%2FUntitled.png?table=block&id=120e5026-32e5-81a7-af60-cf6adf273e3d&cache=v2)
本文的动机主要在于寻找一种方法来解决域泛化问题,即识别不同领域(domains)中的共享语义信息。具体来说,作者观察到图像的高频信息描述了对象的边缘结构,这在不同域之间是自然一致的;而低频成分则包含了对象的平滑结构,它保留了图像的更多能量分布,但是更具域特异性。为了验证这一点,作者计算了PACS数据集上不同域之间高频和低频图像的A-距离,并发现高频图像在不同域之间更为相似。
为了利用这些观察结果,作者对PACS数据集中同一类别的图像执行快速傅里叶变换(FFT),以获取它们的高通滤波版本和低通滤波版本。结果表明,高通滤波的成分不受域变化的影响,保留了我们希望保留的与域无关的语义。然而,高通滤波图像丢失了大部分图像能量,更容易受到背景边缘结构引起的噪声的影响,这使得前景和背景难以区分。相反,尽管低通滤波图像更具域特异性,它们仍然保留了大部分图像能量,例如对象位置信息。因此,低频信息可以作为高频信息的补充,在进行识别时协助高频信息。
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2Feaa0f2a3-6ee1-4000-9a00-711acbc13088%2FUntitled.png?table=block&id=120e5026-32e5-8148-a71e-e67470086a4b&cache=v2)
(ICASSP2024 - FDG_ST) DOMAIN GENERALIZATION WITH FOURIER TRANSFORM AND SOFT THRESHOLDING
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2Fa5140478-5a32-4217-aa5a-2aa907b21097%2FUntitled.png?table=block&id=120e5026-32e5-8129-b6cf-e4ca8d4bc6ed&cache=v2)
![notion image](https://www.notion.so/image/https%3A%2F%2Fprod-files-secure.s3.us-west-2.amazonaws.com%2Fd919c123-ae4b-49b3-af3c-0184fe33faac%2Fd113be59-b3c8-41e0-8f28-b8d537eadba9%2FUntitled.png?table=block&id=120e5026-32e5-81ec-8065-df20381da344&cache=v2)